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摘 要 : [目的 /意义 ] 揭 示 国 内 科学 数据 开放 共享 主题 的 作者 合作 关系 与 合作 研究 内 容 ,以便 为 更 广泛 的 科学 数据 开放 共 
享 提供 参考 。 [ 方法 过程] 利用 2004 -2021 年 CNKI 中 科学 数据 开放 共享 主题 的 期 刊 论文 与 会 议论 文 数据 ,统计 
作者 合作 的 基本 情况 ,并 构建 作者 合作 网 络 ,运用 社会 网 络 方法 分 析 作 者 合作 整体 网 络 、 合 作 团 体 、 合 作 研 究 内 
容 。[ 结果 /结论 ] 国内 科学 数据 开放 共享 主题 的 期 刊 论文 与 会 议论 文 以 作者 合作 研究 为 主 ;作者 合作 的 整体 网 络 


策 、 数 据 安全 、 政 府 数 据 、 数 据 治理 9 个 方面 。 
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随 着 数据 密集 型 科学 范式 的 发 展 ,科学 数据 的 开 
旗 基 享 逐 步 成 为 学 界 共 识 。 与 此 同时 ,为 降低 科学 成 
柱 \ 泊 速 科学 成 果 产 出 ,科学 人 员 开 展 合作 研究 的 需求 
日 浴 增 加 。 目 前 学 界 主要 对 科学 数据 开放 共享 政 
短 ,利益 相关 者 各 角色 责任 与 参与 动力 品 ,服务 创新 
与 嫩 价 ” ,平台 与 应 用 ”、` 运 行 与 保障 机 制 ”对 策 与 
建 芝 ”等 方面 进行 了 广泛 探索 ,但 鲜 见 相关 成 果 论 述 
国内 科学 数据 开放 共享 主题 的 作者 合作 关系 与 合作 研 
究 内 容 。 本 文 拟 对 此 问题 做 初步 分 析 , 以 进一步 促进 
国内 科学 数据 开放 共享 实践 的 发 展 。 


1 数据 来 源 与 研究 方法 


本 文 获取 的 “科学 数据 开放 共享 "主题 下 的 数据 
均 来 自 CNKI 数据 库 ,文献 类 型 限定 为 期 刊 . 会 议 , 因 
为 学 位 论文 是 由 单个 作者 完成 的 ,不 涉及 作者 之 间 的 
合作 ,所 以 本 次 研究 没有 将 其 作为 数据 来 源 。 使 用 主 
题词 "科学 数据 ”或 “研究 数据 ” ,与 主题 词 开放 共享 ” 
组 合 进行 高 级 检索 (检索 时 间 为 2021 年 9 月 26 日 )， 
共 获 得 相关 论文 1 016 篇 ,其 中 期 刊 论文 1 000 篇 ,会 
议论 文 16 篇 ,去 除 匿名 作者 (无 作者 标识 和 本 刊 讯 类 ) 


论文 和 重复 论文 ,将 作者 署名 为 课题 组 ”的 论文 作者 
替换 为 课题 组 成 员 ,最 终 得 到 884 篇 论文 (期 刊 论文 
868 篇 ,会 议论 文 16 篇 ) ,作为 进一步 分 析 的 样本 数 
据 。 

经 文献 检索 发 现 , 早 在 2004 年 ,科学 数据 开放 共 
享 这 一 主题 在 国内 就 已 经 受到 关注 ,不 过 ,2004 -2012 
年 该 主题 发 文 量 均 为 个 位 数 ,2012 年 后 该 主题 发 文 篇 
数 \ 合 车 篇 数 、 发 文 作者 数量 均 呈 现 增长 趋势 。 本 文 分 
析 的 合作 主要 以 合 著 体现 ,在 884 篇 论文 中 ,多 作者 合 
作 完 成 的 论文 为 492 篇 ;作者 数量 共计 达到 1 518 位 ， 
其 中 独立 作者 (未 参与 合作 发 文 ) 占 321 位 , 合 著者 有 
1 197 位 ;在 单 篇 论文 合作 中 ,以 2 -3 位 合作 者 为 多 
数 ,7 人 以 上 合作 完成 的 论文 数量 很 少 ,有 1 篇 论文 的 合 
作者 达 23 位 ( 见 表 1)。 简 而 言 之 ,该 主题 论文 合作 度 为 
1.72( 合 作 度 = 一 定时 期 内 相关 文献 作者 总 数 / 一 定时 
期 内 相关 文献 论文 总 数 x100% ) ,合作 率 为 55.67% ( 合 
作 率 = 一 定时 期 内 相关 文献 合作 论文 数 /一 定时 期 内 相 
关 文 献 论文 总 数 x100% ) ,合作 者 占 该 主题 总 作者 中 的 
比例 为 78.85% 。 这 说 明 , 大 部 分 国内 科学 数据 开放 共 
享 主题 的 期 刊 与 会 议论 文 都 属于 合作 型 研究 。 


# 本 文系 国家 社会 科学 基金 项 目 “ 开 放 科学 环境 下 的 科学 数据 开放 共享 机 制 与 对 策 研 究 ”( 项 目 编号 :18ATQ007 ) 研究 成 果 之 一 。 
作者 简介 : 盛 小 平 ,教授 ,博士 ,博士 生 导 师 ,E-mail:shengxp68@126. com; 孙 傅 倩 ,硕士 研究 生 。 
收 稿 日 期 :2021 -07 -11 修 回 日 期 :2021 -10 -04 本 文 起 止 页 码 :13 -21 本 文责 任 编辑 : 王 传 清 
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表 1 单 篇 论文 作者 人 数 对 应 的 论文 篇 数 


单 篇 论文 作者 人 数 1 2 3 4 5 


6 2 8 9 14 15 23 


论文 篇 数 392 246 128 59 32 


本 文 主要 运用 社会 网 络 分 析 方 法 和 VOSviewer、 
UCINET 等 工具 ,从 作者 合作 整体 网 络 分 析 、 作 者 合作 
团体 分 析 、 作 者 合作 研究 内 容 分 析 3 个 方面 解析 国内 
科学 数据 开放 共享 主题 的 作者 合作 情况 。 


2 作者 合作 整体 网 络 分 析 
将 作者 作为 合作 网 络 的 节点 ,将 其 共同 署名 的 合 
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2s 生 密度 分 析 

CD) 网 络 密 度 反 映 了 节点 间 关 系 的 稀 玉 e ,密度 值 介 于 
0 -1 之 间 , 值 越 接 近 1 则 代表 彼此 间 关 系 越 紧 密 ” 。 
2004 -2021 年 ,国内 科学 数据 开放 共享 主题 下 的 作者 
合作 整体 网 络 的 密度 仅 为 0. 004 ,网络 中 关系 的 标准 
差 为 0.076 ,网络 密度 较 低 ,整体 网 络 具 有 分 散 性 特征 ， 
连通 性 能 较 弱 , 即 节点 间 的 关系 过 于 稀 玖 ,表明 作者 之 
间 的 交流 互动 存在 一 定 障碍 。 
2.2 ”中 心性 分 析 

中 心性 分 析 包 含 网 络 中 节点 的 点 度 中 心 度 .中 间 

中 心 度 .接近 中 心 度 的 测量 。 在 计算 点 度 中 心 度 时 ,由 
于 一 篇 论文 是 由 23 人 合作 的 , 旦 其 中 的 郝 普 新 、 醉 艳 
杰 、 瞧 尾 州 义 与 其 他 3 位 作者 合作 了 一 篇 论文 ,所 以 ， 
这 23 位 作者 的 点 度 中 心 度 都 在 22 以 上 ;参考 普 莱 斯 
定律 K=0.749 VN 来 筛选 合作 发 文 量 高 的 核心 作 
者 ,其 中 N, .为 合作 发 文 量 最 多 的 论文 篇 数 。 选 取 的 
样本 数据 中 合作 发 文 量 最 多 的 篇 数 为 17 篇 ,计算 出 天 
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作 关 系 作为 边 , 且 不 以 作者 在 单 篇 论文 中 的 贡献 大 小 
区 分 权重 比例 ,可 以 构建 无 向 对 称 的 国内 科学 数据 开 
放 共 享 主题 下 作者 合作 的 整体 网 络 ( 见 图 1) ,其 中 a、 
be 为 拥有 合作 关系 的 作者 数量 排名 前 三 位 的 团体 ， 
团体 a 由 102 人 组 成 ,团体 b 由 29 人 组 成 ,团体 c 由 
28 人 组 成 。 作 者 合作 的 整体 网 络 是 反映 作者 合作 关 
系 的 一 个 主要 方式 ,其 密度 分 析 与 中 心性 分 析 如 下 。 


图 注 ; a-102 人 团体 ”5b-29 人 团体 。 c-28 人 团体 


图 1 作者 合作 整体 网 络 


=3.09, 由 此 得 出 科学 数据 开放 共享 主题 中 参与 合作 
的 核心 作者 是 合作 发 文 篇 数 在 4 篇 及 以 上 的 作者 , 共 
有 26 人 ( 见 表 2) ,而 合作 发 文 量 排名 前 3 位 的 作者 黄 
如 花 、 顾 立 平 盛 小 平 的 点 度 中 心 度 分 别 为 15 .19 、13， 
低 于 上 述 23 位 作者 。 这 是 缘 于 该 作者 合作 整体 网 络 
规模 不 大 、 分 析 样本 数量 不 足够 多 而 产生 的 一 种 特例 ， 
但 点 度 中 心 度 与 合作 团体 规模 大 小 有 正 向 相关 关系 。 
中 间 中 心 度数 值 越 大 ,表明 该 节点 处 于 越 多 节点 
经 过 的 网 络 路 径 上 ”。 在 表 2 中 ,中 间 中 心 度数 值 最 
大 的 是 石 蔓 ,意味 着 她 在 整个 网 络 中 担任 桥梁 作用 最 
大 掌握 资源 的 能 力 最 强 。 中 间 中 心 度 排 名 前 26 位 的 
作者 中 黄 如 花 、 黄 雨 婷 属于 29 人 团体 ,杨帆 属于 28 人 
团体 ,其 余 23 人 均 属于 102 人 团体 ( 见 图 1)。 但 合作 
发 文 量 排名 前 26 位 的 盛 小 平 . 马 海 群 、 邢 文明 、 温 廓 
芳 、 肯 婷 、 钱 庆 、 于 广 军 、 李 洋 、 吴 思 竹 、 张 满月 、 杨 现 民 、 
朱 扬 勇 并 未 出 现在 中 间 中 心 度 排名 前 26 位 的 作者 中 。 
这 说 明 作 者 合作 发 表 论 文 数量 与 作者 中 间 中 心 度 虽 然 
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一 21. 
表 2 合作 发 文 篇 数 与 3 种 中 心 度 排名 前 26 的 作者 

作者 合作 发 文 篇 数 作者 点 度 中 心 度 作者 中 间 中 心 度 作者 接近 中 心 度 
黄 如 花 17 郝 晋 新 25 石 划 2 696 石 划 11 211 
顾 立 平 13 崔 辰 州 25 高 备 绪 1 838 高 孟 绪 11 229 
盛 小 平 13 薛 艳 杰 25 王 健 1 572 王 瑞 丹 11 243 
马 海 群 9 杨帆 23 顾 立 平 1 365 王 超 11244 
桨 建 辉 8 许 允 飞 22 胡 良 霖 1 119 胡 良 霖 11 246 
温 亮 明 7 刘 梁 22 陈 志 炊 737 徐 波 11 250 
高 孟 绪 6 杨 丝 丝 22 王 瑞 丹 732 顾 立 平 11 258 
张 丽 丽 6 和 兰 22 王 超 728 黎 建 辉 11 259 
王 超 6 何 勃 亮 22 黎 建 辉 603 张 丽 丽 11 263 
王 瑞 丹 6 米 琳 莹 22 张 辉 486 朱 艳 华 11 274 
王 健 5 攀 东 卫 22 宋 立 荣 415 高 瑜 蔚 11 274 
邢 文 明 5 杨 涵 溪 22 届 宝 强 405 温 亮 明 11 282 
温 芳 芳 5 李 长 华 22 次 景 超 388 郑 晓 欢 11 286 
GO ii 5 圳 海 波 好 赵 华 388 王 健 11 291 
于 钱 庆 5 刘 峰 22 周 园 春 322 陈 志 净 11 293 
二 开 广 持 5 韩 军 22 赵 伟 294 杨 静 11 304 
© 李洋 5 陈 肖 22 孙 亮 294 周 园 春 11 306 
下 吴 思 竹 5 肖 健 2 张 丽 丽 291 李 成 11 306 
OO na 4 马 捷 2 黄 如 花 291 张 贵 关 11 309 
这 张江 月 4 于 策 22 李 成 赞 265 活 尧 11 309 
人] 声 现 民 4 陶 一 寒 六 赫 运 涛 245 王 玉 清 11 312 
ON ma 4 李珊珊 22 温 亮 明 212 王 卷 乐 11 312 
> 本 成 赞 4 诬 俊 灯 22 董 诚 198 王 妹 11 316 

mm 

>< 朱 扬 勇 4 张 海 龙 22 杨帆 194 郭志 斌 11 316 
© 石 曹 4 顾 立 平 19 黄 雨 婷 180 刘 佳 11 316 
ae 徐 波 4 周 园 春 16 徐 波 158 王丽娟 11 319 


月 向 关系 ,但 不 是 简单 的 线性 关系 ,作者 中 间 中 心 度 
还 与 作者 所 在 合作 团体 规模 的 大 小 有 正 向 关系 。 

接近 中 心 度数 值 越 小 ,表明 该 节点 与 其 他 节点 间 
的 距离 就 越 短 ,获取 和 传递 信息 更 加 容易 旦 不 必 依赖 
他 人 。 接 近 中 心 度 排名 前 26 位 的 数值 都 较 大 ( 见 表 
2) , 且 接 近 中 心 度 排 名 前 26 位 的 作者 均 属 于 最 大 规模 
的 102 人 团体 ( 见 图 1) ,其 中 包括 合作 发 文 量 排名 前 
26 位 中 的 石 蔓 高 备 绪 、 王 瑞 丹 、 王 超 、 胡 良 霖 、 徐 波 、 
顾 立 平 黎 建 辉 、 张 丽 丽 、 温 亮 明 、 王 健 、 周 园 春 、 李 成 
赞 。 但 发 文 量 排名 前 26 位 的 余下 13 位 作者 没有 出 现 
在 接近 中 心 度 排名 前 26 位 的 作者 中 。 这 说 明 国内 科 
学 数据 开放 共享 主题 下 的 作者 合作 整体 网 络 中 的 信息 
传递 尚 不 够 通畅 ,但 在 合作 团体 内 则 形成 了 较为 良好 
的 信息 获取 途径 。 因 此 ,在 国内 科学 数据 开放 共享 主 
题 的 作者 合作 网 络 中 ,作者 所 在 合作 团体 规模 与 合作 
次 数 ,都 会 影响 着 其 中 间 中 心 度 与 接近 中 心 度 。 


3 ”作者 合作 团体 分 析 


作者 合作 团体 是 反映 作者 合作 关系 的 另 一 个 主要 
参数 。 图 1 所 示 的 作者 合作 整体 网 络 结构 分 散 , 绝 大 
部 分 团体 相互 独立 , 跨 团 体 合 作 较 少 ,因此 ,有 必要 进 
一 步 分 析 作 者 合作 团体 数量 与 结构 。 
3.1 作者 合作 团体 数量 分 析 

1 197 位 参与 合作 的 作者 形成 了 314 个 合作 团体 。 
合作 团体 数量 最 多 的 是 由 2 人 组 成 的 小 团体 , 共 150 
个 ;其 次 是 由 3 人 组 成 的 小 团体 , 共 84 个 ;有 9 个 唯一 
的 合作 团体 ( 见 表 3) 。 最 大 规模 的 作者 合作 团体 有 
102 人 ,由 6 个 小 团体 因 “ 合 作 关 系 ” 而 成 ( 见 图 2 左 ) ; 
第 二 大 规模 的 作者 合作 团体 有 29 人 ,由 2 个 小 团体 因 
“合作 关系 ”而 成 ( 见 图 2 右 ) 。 由 此 看 来 ,国内 科学 数 
据 开放 共享 研究 主题 已 初步 形成 具有 一 定数 量 和 不 同 
规模 的 合作 团体 。 
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表 3 合作 团体 数量 与 结构 分 布 


团体 人 数 团体 数量 细 分 的 团体 数量 《团体 网 络 结构 类 型 团体 人 数 团体 数量 细 分 的 团体 数量 ” 团体 网 络 结构 类 型 
2 150 150 双核 型 9 4 本 桥 连接 型 
3 84 79 网 架 型 1 星 型 
5 流线型 1 网 架 型 
4 40 35 网 架 型 i 2 2 桥 连接 型 
2 星 型 12 1 1 桥 连接 型 
2 桥 连接 型 13 1 1 桥 连接 型 
1 流线型 14 1 1 桥 连 接 型 
5 9 4 网 架 型 15 2 这 桥 连 接 型 
2 桥 连 接 型 16 1 1 桥 连接 型 
2 星 型 19 1 1 桥 连接 型 
1 流线型 26 1 1 桥 连 接 型 
6 7 5 网 架 型 28 1 1 桥 连 接 型 
2 桥 连接 型 29 1 1 桥 连接 型 
™ 
>> 7 5 4 桥 连接 型 102 1 1 桥 连接 型 
ee】 1 星 型 
8 2 1 网 架 型 
< 1 桥 连 接 型 
G38 计 : 双 核 型 150 个 ,网 架 型 125 个 , 桥 连 接 型 26 个 , 星 型 6 个 ,流线型 7 个 
图 
© a 
CD 2 忆 作 4 
9 n 
CN RS 
©O 四 -Ne ww 
S29 
CN a 3 ‘G1 2 Be >、 团 体 H 
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最 大 规模 作者 合作 团体 ( 102 人 ) 


第 二 大 规模 作者 合作 团体 (28 人 ) 


2 规模 排名 前 两 位 的 作者 合作 团体 


3.2 ”作者 合作 团体 结构 分 析 

本 文 将 科学 数据 开放 共享 主题 下 的 作者 合作 网 络 
中 的 拓扑 结构 类 型 归纳 为 双核 型 .网 架 型 . 桥 连接 型 、 
星 型 和 流线型 5 种 ”, 其 中 ,双核 型 结构 是 指 两 人 合作 
团体 ( 见 图 3(A)); 网 架 型 结构 是 指 任意 两 个 节点 之 
间 都 有 联系 的 作者 合作 团体 模式 ( 见 图 3(B)); 桥 连 
接 型 结构 是 指 需 要 通过 桥 节 点 将 多 个 节点 或 合作 团体 
连接 起 来 的 作者 合作 团体 模式 ,表现 为 混合 网 络 结构 


状态 ( 见 图 3(C) ); 星 型 结构 是 指 以 一 个 节点 为 核心 
将 分 散 的 节点 连接 起 来 的 作者 合作 团体 模式 ( 见 图 3 
(D) ) ;流线型 结构 是 指 节点 与 节点 以 线性 方式 而 非 交 
叉 方式 形成 合作 关系 的 作者 合作 团体 模式 ( 见 图 3 
(EF))。 在 5 种 模式 中 ,最 多 的 是 双核 型 结构 ( 占 
47.8% ) ,其 次 是 网 架 型 结构 ( 占 39.8% ) ,流线型 结构 
仅 出 现在 3 -5 人 的 小 型 合作 团体 中 ,而 10 人 以 上 的 
合作 团体 均 呈 现 桥 连接 型 结构 ( 见 表 3 ) 。 
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张 浪 明 wh aN 帮 质 尖 
二 J a 孙 建 军 
bid A 
(A) (B) {C) (D) (BE) 
双核 型 网 架 型 桥 连 接 型 星 型 流线型 


图 3 合作 团体 网 络 结构 模型 举例 


4 _ 作 者 合作 研究 内 容 分 析 

选择 492 篇 合作 论文 进行 作者 合作 研究 的 内 容 分 
析 , 从 中 提取 出 关键 词 1 158 个 ,在 对 同 义 关键 词 如 科 
学 数据 与 研究 数据 政府 数据 开放 与 开放 政府 数据 等 


合并 的 基础 上 ,构建 关键 词 矩 阵 后 导入 VOSviewer 中 ， 
选择 出 现 7 次 以 上 的 高 频 关 键 词 进行 聚 类 ,生成 高 频 关 
键 词 共 现 图 谱 ( 见 图 4) ,主要 包括 大 数据 、 科 学 数据 、 开 
放 共 享 .数据 出 版 ,数据 管理 .数据 政策 .数据 安全 ,政府 
数据 数据 治理 9 个 分 主题 ,其 合作 研究 内 容 如 下 : 


ee A 数 护 策 
下 开 < | 
科 j 才 和 浙 J 车 2 4 
by > 7 A 
© WW /XX y 
2 A 一 \ 月 A 、 
~ | YN ty 
[| 政 /一 h 理 >d 1 -ACT NS N= ss 一 | 
> < <\S 更 并 7 <S | 
人 站 和 f 枉 vA 多 、 和 3 管理 
三 六 
二 
© x 久 下调 疯 和 放 
i EC 类 者 喇 源 
4 大 于 7 次 的 高 频 关 键 词 共 现 图 谱 
4.1 大 数据 以 需要 借助 大 数据 技术 ,如 大 数据 图 像 识别 技术 、 视 频 
该 主题 集中 于 科学 数据 开放 共享 的 大 数据 背景 、| 录制 技术 、 信 息 采 集 技术 等 ,并 结合 物 联网 、 云 存储 、 人 


大 数据 领域 .大 数据 技术 以 及 大 数据 对 开放 共享 的 要 
求 等 方面 。 大 数据 时 代 , 数 据 的 处 理 与 应 用 方式 均 产 
生 了 巨大 的 变化 ,科学 研究 进入 以 数据 密集 型 科学 发 
现 为 主要 特征 的 科学 研究 新 范式 ,对 科学 数据 的 保存 、 
管理 和 共享 需求 不 断 提升 "”, 同时 在 战略 、 公 众 等 众 
多 领域 产生 了 相应 的 开放 共享 需求 与 多 样 的 开放 共享 
模式 。 人 们 特别 关注 健康 医疗 大 数据 ,农业 大 数据 、 对 
地 观测 大 数据 、 信 用 大 数据 政务 大 数据 等 方面 的 科学 
数据 资源 现状 和 共享 服务 。 然 而 ,由 于 传统 的 数据 处 
理 软件 无 法 在 规定 时 间 内 处 理 各 种 类 型 的 大 数据 ,所 


工 智能 等 新 一 代 信息 和 网 络 技术 ,共同 助力 科技 资源 
共享 ,以 实现 对 数据 的 集成 .挖掘 、 展 示 及 管理 。 
此 ,大 数据 时 代 需 要 加 强 对 科学 数据 的 质量 管理 ,确保 
开放 共享 科学 数据 的 规范 性 、 准 确 性 真实 性 和 时 效 
性 ;建立 机 构 联盟 大 数据 库 ,加强 同类 型 机 构 之 间 的 数 
据 信息 共享 和 互联 互动 ” ,促进 不 同类 型 .不 同学 科 
领域 科学 数据 的 交叉 融合 与 综合 应 用 。 
4.2 科学 数据 

该 主题 聚焦 于 科学 数据 的 内 涵 与 特点 、 现 状 与 问 
题 .管理 政策 .影响 因素 以 及 应 对 策略 等 方面 。 科 学 数 
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据 是 指 科技 活动 中 所 产生 的 各 类 基础 性 .观测 性 的 数 
据 资料 和 相关 信息 ,是 科学 成 果 最 重要 的 信息 载体 , 具 
有 客观 性 多样 性 、 基 础 性 资源 性 ,传递 性 ,共享 性 ` 增 
值 性 等 特点 。 国 内 高 校 和 研究 机 构 陆续 建立 数据 
仓储 ,出 版 社 相继 推出 数据 期 刊 , 商 业 公司 也 推出 各 种 
数据 服务 ,科学 数据 集 的 数量 呈 指 数 增长 态势 " 。 但 
与 国外 相 比 , 国 内 科学 数据 共享 平台 建设 起 步 相 对 较 
晚 ,法 律 法 规 缺失 ,制度 保障 体系 尚 待 完善 ;集成 度 有 
限 ,数据 来 源 相对 单一 。 国 内 外 科学 数据 开放 共享 受 
到 科学 人 员 .政策 数据. 技术、 组织 .平台 ,法 律 和 资金 
8 个 方面 影响 " 。 为 进一步 推进 科学 数据 开放 共享 ， 
应 从 健全 法 律 法 规 政策 和 标准 体系 ,完善 管理 规划 和 
监管 模式 ,利用 新 一 代 信息 技术 实现 技术 保障 ,增强 内 
外 合作 协同 共 建 ,加 强人 才 队 伍 建设 等 方面 打造 开放 
共 强 体系 "" 。 

4 避 - 开放 共享 

守 该 主题 集中 于 科学 数据 开放 共享 的 原则 ,共享 模 
行 模式 与 实现 途径 ,存在 问题 .关键 机 制 与 策略 
淹 面 。FAIR( 可 发 现 .可 访问 .可 互 操作 ,可 重用 ) 已 
兢 为 科学 界 广泛 接受 和 认可 的 科学 数据 开放 共享 原 
。 目 前 ,国内 外 已 有 的 科学 数据 共享 模式 可 总 结 
将 DW 下 5 种 :政策 主导 型 组织 合作 型 ,专题 驱动 型 数 
撕 蜡 版 型 ,数据 集 市 型 9 。 科 学 数据 开放 共享 的 运行 
模式 通常 包括 政府 主导 下 的 公益 性 运行 模式 和 市 场 主 
当下 的 商业 化 运行 模式 ,其 实现 途径 主要 有 数据 知识 
库 数 据 期 刊 . 学 术 期 刊 的 数据 说 明文 件 3 种 。 然 
而 -我 国 科学 数据 的 开放 共享 尚 属 基础 性 、 理 论 性 探索 
阶段, 仍 缺少 强 有 力 的 政策 法 规 的 支撑 ,与 国际 组 织 勾 
业务 沟通 和 项 目 合作 偏 少 ;科技 数据 资源 分 布 不 均 , 共 
享 进度 不 均衡 ;科技 资源 共享 平台 建设 繁杂 ,缺乏 统一 
标准 ;传统 的 保守 思想 观念 浓厚 ,制约 共享 积极 性 5 。 


人 一 
六 


模式 和 出 版 流程 期 刊 数据 出 版 政策 数据 出 版 面临 的 
问题 和 对 策 等 方面 。 数 据 出 版 不 仅 可 以 推动 数据 开放 
共享 ,促进 整个 学 术 出 版 和 科学 研究 的 发 展 ,而 且 可 以 
利用 数据 开放 共享 解决 数据 知识 产权 问题 ,保障 科学 
数据 的 质量 ,提高 数据 重用 的 价值 ”。 科 学 数据 出 版 
需要 达到 科学 数据 标准 化 引用 唯一 化 识别 ,便捷 化 利 
的 要 求 …” 。 数 据 出 版 模式 包括 独立 的 数据 出 版 ( 即 
在 数据 存储 库存 储 发 布 )\ 作 为 论文 辅助 资料 的 数据 发 
布 ,以 数据 论文 形式 发 布 3 种 类 型 ” 。 一 般 的 数据 出 
版 流程 包括 数据 提交 数据 存储 、 数 据 评审 、 数 据 引 用 
和 数据 评价 5 个 环节 。 目 前 ,国际 大 型 出 版 机 构 数 
据 出 版 政策 涉及 数据 提交 、 数 据 评审 数据 开放 与 存 
储 数据 保护 4 个 方面 ,积极 或 励 作者 提交 和 共享 数 
据 ; 而 国内 期 刊 数据 政策 对 数据 出 版 的 要 求 与 说 明 还 
不 成 体系 “ 。 数 据 出 版 面临 的 主要 问题 是 ,数据 出 版 
与 传统 出 版 相 比 在 树立 学 术 地 位 和 行业 认可 度 等 方面 
还 有 待 提升 ,其 还 存在 运营 模式 尚 不 够 成 熟 ”数据 
存储 设施 建设 不 足 ,数据 评审 体系 不 健全 数据 知识 产 
权 侵 权 严 重 数据 引用 效果 不 佳 等 问题 ”。 为 应 对 这 
些 挑战 ,我 国 科 学 数据 出 版 应 加 快 建立 一 批 开放 、 规 
范 、 严 格 的 质量 控制 机 制 、 支 持 FAIR 原则 的 数据 存储 
库 ; 探 索 新 型 出 版 模式 ,建立 数据 出 版 中 的 权益 保护 机 
制 ; 规 范 数据 引用 ;完善 数据 评审 体系 ,保障 科学 数据 
质量 ;重视 数据 知识 产权 ,推动 数字 资产 管理 。 
4.5 数据 管理 

该 主题 聚焦 于 数据 管理 的 对 象 与 原则 .科学 数据 
管理 规划 与 办 法 .科学 数据 管理 机 构 与 管理 服务 .实践 
现状 与 发 展 建议 等 方面 。 数 据 管理 的 对 象 主要 是 大 数 
据 .政府 数据 科学 数据 .企业 数据 ” ,其 原则 主要 包 
括 数据 价值 量化 数据 质量 控制 .元 数据 管理 .计划 管 
理 团队 协作 动态 管理 .生命 周期 管理 .风险 管理 、 技 
术 关 联 性 .领导 支持 原则 。 科 学 数据 管理 规划 描述 


| 


| 


因此 ,需要 通过 有 效 的 激励 机 制 不 断 强化 数据 开放 共 
享 驱动 力 ,通过 长 效 评价 机 制 不 断 完善 数据 开放 共享 
模式 ,通过 多 级 传播 机 制 拓 展开 放 数 据 传播 渠道 ,以 实 
现 数据 资源 从 开放 到 传播 到 再 利用 完整 链 路 的 良性 循 
环 。 此 外 ,我 国 阴 等 采 取 有 效 策略 来 促进 科学 数据 开 
放 共 享 , 这 包括 构建 科学 数据 开放 共享 体系 ,加 强 科学 
数据 的 保存 积累 和 分 析 挖 掘 ,对 科学 数据 权利 进行 合 
理 界定 和 有 效 保护 ,逐步 推动 科学 数据 的 分 级 分 类 开 
放 , 提 升 科学 数据 开放 共享 的 国际 合作 实践 ” ,开发 
标准 化 数据 产品 来 实施 开放 共享 ”等 。 
4.4 数据 出 版 

该 主题 聚焦 于 科学 数据 出 版 的 作用 和 要 求 .出 版 


了 将 要 编写 的 数据 以 及 在 整个 生命 周期 中 如 何 管理 数 
据 并 使 之 可 访问 ,主要 包括 项 目 预期 产生 的 数据 内 容 、 
类 型 ,规模 质量、 提交 时 间 和 最 终 汇 交 的 科学 数据 管 
理 机 构 名 称 等 ,有 助 于 有 计划 地 推进 科学 数据 管理 。 
《科学 数据 管理 办 法 》 为 我 国 科学 数据 管理 提供 了 安 
观 指导 ,其 内 容 、 落 实现 状 .影响 因素 及 推进 策略 等 受 
到 关注 ”。 科 学 数据 管理 各 级 单位 需要 按照 《科学 数 
据 管 理 办 法 ) 明 确 责任 担当 ,协同 参与 科学 数据 管理 实 
践 ;图 书 情报 机 构 应 当 大 力 推广 科学 数据 管理 服 
务 ;数据 管理 机 构 应 该 广泛 应 用 新 技术 ,积极 推动 
开放 数据 管理 的 成 熟 与 发 展 。 国 内 科学 数据 管理 实践 
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忆 必 各 YE 于 


日 趋 成 熟 , 但 科学 数据 管理 多 集中 于 自然 与 工程 科学 ， 
社会 科学 数据 管理 实践 仍 有 很 大 进步 空间 。 可 以 
采取 以 下 措施 来 促进 我 国 科学 数据 管理 :制定 操作 性 
强 的 实施 方案 ,落实 数据 共享 办 法 ;加 强 科 学 数据 共享 
监管 .知识 产权 保护 ,并 对 数据 跨 境 管理 予以 研究 和 规 
制 ;加 强国 家 科学 数据 中 心 建设 和 科学 数据 持续 整合 ; 
提高 数据 管理 意识 ,培养 相关 人 才 等 1。 
4.6 数据 政策 

该 主题 着 重 于 国内 外 组 织 或 机 构 数据 政策 调研 与 
文本 内 容 分 析 。 许 多 国际 组 织 制定 了 科学 数据 开放 共 
享 政策 ,这 些 政策 比较 注重 科学 数据 开放 共享 的 价值 、 
知识 产权 及 其 保护 , 互 操作 和 高 质量 ,评估 和 强调 利益 
相关 者 的 责任 担当 等 内 容 ' 站 。 国 际 出 版 机 构 .科学 教 
毅 楷 构 .科学 资助 机 构 等 也 制定 了 相关 科学 数据 政策 ， 
涉 芒 呈 缴 政策 .存储 规范 ,监督 机 制 与 质量 保障 规范 、 
开 渡 程度 传播 规范 和 利用 方式 等 内 容 。 例 如 ,Spring- 
en nd dn 
性 古 个 不 同 级 别 的 数据 许可 政策 "5 。 我 国 初步 搭建 
起 插 从 中 央 到 地 方 科学 数据 管理 与 共享 的 政策 体系 ， 
全 时 区 开放 数据 政策 建设 的 状况 参差 不 齐 , 且 地 方 政 
腹 开 放 数据 政策 主要 以 意 0 
办 政策 的 约束 力 和 强制 力 有 等 提升 ,政策 落实 仍 需 


续 税 累 ee 
网 要 安全 如 何 东 实 等 部 人 得 进 一 步 研究 和 探讨 5 。 
42K 数据 安全 


性 该 主题 注重 数据 安全 的 法 律 法 规 .政策 技术、 治 
理 笑 方面 。 数 据 安全 涉及 相关 法 律 和 标准 ,也 涉及 数 
据 表 密 、 软 硬件 数据 保护 机 制备 份 .数据 屏 琶 和 数据 
清除 等 技术 '” 。 在 没有 颁布 《中华 人民 共 和 国 数据 安 
全 法 》 之 前 ,我 国保 障 数据 安全 的 相关 法 律 主要 是 《中 
华人 民 共 和 国 网 络 安全 法 兴 中 华人 民 共 和 国 国家 安 
全 法 ) 等 ”。 目 前 我 国 数据 安全 政策 着 重 于 网 络 安全 
保障 、 个 人 隐私 保护 数据 跨 境 流动 以 及 开放 数据 平台 
的 安全 保障 等 方面 的 部 署 ”" ,同时 比较 关注 数据 安全 
治理 。 在 实施 数据 安全 技术 治理 过 程 中 ,应 充分 利用 
区 块 链 技 术 “” 隐私 增强 技术 .数据 认证 技术 与 构建 
基于 数据 联盟 的 国家 科学 数据 中 心 ”。 不 过 维护 数 
据 安全 不 仅 是 一 个 技术 问题 ,更 是 一 个 管理 的 问 
题 ” 。 因 此 ,需要 加 强 数据 安全 管理 治理 ,包括 建立 
科学 数据 分 级 分 类 标准 与 系统 .实施 数据 保护 影响 评 
估 、 提 高 科学 数据 质量 。 从 长 远 来 看 ,数据 安全 固 
然 重 要 ,但 是 数据 开放 共享 是 大 势 所 趋 ,因此 需要 完善 
数据 开放 保障 机 制 , 在 数据 开放 与 数据 安全 之 间 找 到 


均衡 点 “|。 
4.8 政府 数据 

该 主题 聚焦 于 政府 数据 开放 的 价值 .政策 与 标准 
体系 .问题 与 对 策 等 方面 。 政 府 数据 开放 主要 是 指 政 
府 机 构 在 法 律 法 规范 围 内 开放 、 共 享 其 生产 或 拥有 的 
按照 一 定 标 准 规范 组 织 过 的 数据 集 , 可 供 企业 、 公 民 、 


研究 者 等 自由 使 用 ， ns “政府 数据 开 
放 具 有 政治 、 社 会. 经济 和 技术 价值 ” 。 自 2015 年 国 


人 中 央 和 地 
方 政府 制定 了 一 系列 数据 开放 政策 ,涉及 数据 基础 设 
a 8 周期 的 数据 资源 管理 
政策 .政府 治理 政策 等 ”。 国 外 政府 数据 开放 的 政策 
法 规 与 标准 .合作 模式 与 建设 经 验 '” 也 引起 了 国内 
学 者 的 兴趣 。 政 府 数据 开放 共享 需要 关注 政府 数据 及 
元 数据 ,数据 管理 .数据 安全 和 隐私 、 数 据 权 益 和 用 户 
参与 等 问题 。 为 应 对 这 些 问 题 ,需要 进一步 规范 政府 
数据 开放 途径 ,强化 政府 作品 著作 权 保 护 , 完 善 地 方 政 
府 数据 开放 平台 功能 ,注重 对 我 国政 府 数 据 开放 标准 、 
数据 质量 控制 .用 户 利用 方面 的 研究 。 
4.9 数据 治理 
该 主题 聚焦 于 数据 治理 的 定义 .范围 与 类 型 .存在 
的 问题 治理 思路 与 建议 等 方面 。 数 据 治理 是 制定 标 
准 .规则 .政策 和 实施 监督 以 确保 遵守 数据 管理 最 佳 做 
法 的 过 程 ”' 。 在 治理 范围 上 ,数据 治理 可 分 为 全 球 数 
据 治 理 、 国 家 数据 治理 政府 数据 治理 和 企业 数据 治 
理 ” 。 由 于 国内 数据 治理 相关 理论 体系 尚未 健全 , 数 
据 治 理 开展 过 程 中 遇 到 了 许多 挑战 和 阻碍 ,在 制度 设 
计 、 技 术 能 力 、 人 力 资源 .管理 和 数据 等 方面 都 存在 一 
些 问题 ,如 大 数据 关键 技术 研发 灌 后 数据 治理 体 
系 层次 不 清 数据 主权 保护 权 责 模糊 .数据 生产 要 素 价 
值 实现 困 难 数据 安全 和 个 人 隐私 面临 风险 等 ” 。 为 
进一步 实施 数据 治理 ,应 提高 数据 质量 ,建立 数据 交易 
流通 制度 ,加 强 数 据 人 才 培 养 和 数据 治理 体系 建设 , 设 
置 数 据 治理 指导 委员 会 和 数据 治理 咨询 委员 会 等。 


5 结论 


通过 对 国内 科学 数据 开放 共享 主题 的 作者 合作 整 
体 网 络 ,作者 合作 团体 数量 与 结构 ,作者 合作 研究 内 容 
的 分 析 , 可 以 发 现 :(D2012 年 后 ,国内 科学 数据 开放 共 
享 主题 下 的 发 文 篇 数 、 合 车 篇 数 .作者 数量 均 呈 现 增长 
趋势 , 且 期 刊 论文 和 会 议论 文 一 半 以 上 属于 合作 研究 
成 果 。@@ 国 内科 学 数据 开放 共享 主题 中 相关 作者 合作 
的 整体 网 络 密度 较 低 , 分 散 性 较 强 、 连 通 性 较 弱 ,意味 
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着 这 些 作者 之 间 的 科学 数据 共享 和 交流 互动 存在 一 定 
障碍 ;而 作者 所 属于 的 合作 团体 规模 与 合作 次 数 ,都 会 
影响 着 他 们 在 作者 合作 整体 网 络 中 的 中 间 中 心 度 与 接 
近 中 心 度 。 久 国内 科学 数据 开放 共享 研究 主题 已 形成 
由 1197 位 合作 者 构成 的 314 个 合作 小 团体 ,其 中 包括 
150 个 2 人 小 团体 .84 个 3 人 小 团体 和 其 他 小 团体 ,最 
大 规模 的 小 团体 是 由 102 人 组 成 ;这 些 合作 团体 在 科 
学 数据 开放 共享 主题 作者 合作 网 络 中 呈现 双核 型 .网 
架 型 桥 连接 型 . 星 型 和 流线型 5 种 拓扑 结构 模式 ,其 
中 ,双核 型 结构 和 网 架 型 结构 是 该 合作 网 络 中 的 主要 
模式 。 外 国内 科学 数据 开放 共享 作者 合作 研究 内 容 主 
要 覆盖 大 数据 .科学 数据 ` 开 放 共享 .数据 出 版 ,数据 管 


理 与 治理 .数据 政策 .数据 安全 政府 数据 ,数据 治理 9 


个 分 主题 ,形成 了 一 系列 相关 理论 观点 。 今 后 随 着 科 
学 侨 据 开 放 共 享 的 进一步 发 展 ,将 可 能 在 科学 研究 中 
出 现 新 型 的 开放 共享 合作 关系 与 合作 研究 内 容 ,这 是 


步 研究 值得 继续 关注 的 问题 。 
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站 V 会 1 { 芷 其 
盛 小 平 ， 孙 倩 倩 . 国内 科学 数据 开放 共享 主题 的 作者 合作 关系 与 合作 研究 内 容 分 析 [ J]. 图 书 情 i MS 朝天 
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全 Analysis of Authors ”Cooperative Relationships and Research Contents 
CC on the Topic of Open Sharing of Scientific Data in China 
= Sheng Xiaoping Sun Qianqian 
© School of Library, Information and Archives, Shanghai University, Shanghai 200444 
Abstract: | Purpose/significance | In order to provide references for more extensive open sharing of scientific 
data, the authors ”cooperative relationships and research contents on the topic of open sharing of scientific data in 
china are revealed. | Method/process| Based on the data of journal papers and conference papers on the subject of 
open sharing of scientific data in CNKI from 2004 to 2021, the basic situation of author cooperations was analyzed, 
and the author cooperation networks were constructed. The overall author cooperation network, cooperative groups 
and cooperative research contents were analyzed by using the social network method. | Result/ conclusion | The jour- 
nal papers and conference papers on the subject of open sharing of scientific data in China are mainly based on author 
cooperative researches. The overall network density of author cooperation is low, and the size and frequency of coop- 
eration affect the centrality. The structures of authors ” cooperative group present five modes of double core, grid, 
bridge , star and streamline. The contents of authors ”cooperative researches cover 9 aspects, including big data, sci- 
entific data, open sharing, data publishing, data management, data policy, data security, government data and data 
governance. 
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